Paulina Jaszczuk - praca domowa 1

Wczytanie pakietów

Wczytanie danych

Rozszyfrujmy niezrozumiałe skróty:

The Fine Fuel Moisture Code (FFMC)

represents fuel moisture of forest litter fuels under the shade of a forest canopy. It is intended to represent moisture conditions for shaded litter fuels, the equivalent of 16-hour timelag. It ranges from 0-101. Subtracting the FFMC value from 100 can provide an estimate for the equivalent (approximately 10h) fuel moisture content, most accurate when FFMC values are roughly above 80.

The Duff Moisture Code (DMC)

represents fuel moisture of decomposed organic material underneath the litter. System designers suggest that it is represents moisture conditions for the equivalent of 15-day (or 360 hr) timelag fuels. It is unitless and open ended. It may provide insight to live fuel moisture stress.

The Drought Code (DC)

much like the Keetch-Byrum Drought Index, represents drying deep into the soil. It approximates moisture conditions for the equivalent of 53-day (1272 hour) timelag fuels. It is unitless, with a maximum value of 1000. Extreme drought conditions have produced DC values near 800.

The Initial Spread Index (ISI)

is analogous to the NFDRS Spread Component (SC). It integrates fuel moisture for fine dead fuels and surface windspeed to estimate a spread potential. ISI is a key input for fire behavior predictions in the FBP system. It is unitless and open ended.

Wstępna eksploracja

Nie ma braków, dane numeryczne i obiekty. describe() automatycznie nie wzięło do analizy kolumn z danymi innymi niż numeryczne, przez co się nie wysypało - fajne!

Przegląd wizualizacji

Najwyższa korelacja występuje pomiędzy cechami FFMC i ISI, DMC i DC oraz RH i temperaturą

Jak widać wraz ze wzrostem temperatury maleje względna wilgotność.

Usuńmy zmienne odstające:

Korelacje ze zmienną 'area'

Widzimy kilka zmiennych odstających.

Analiza konkretnych obszarów

Istnieją obszary, w których pożary występują zdecydowanie najczęściej, oraz takie, w których są one sporadyczne.

Zależność liczby pożarów od dni tygodnia i miesięcy

Jak widzimy, zdecydowanie najwięcej pożarów miało miejsce w sierpniu i wrześniu. Z kolei jeśli chodzi o dzień tygodnia, przodują dni weekendowe.

Eksploracja z wykorzystaniem wbudowanych narzędzi

Narzędzie umożlwia nam wstępną analizę danych. Oczywiście, nie jest ono tak dokładne i "spersonalizowane" jak własnoręczna analiza, ale może być przedatne we wstępnym etapie. Jego sporą wadą jest to, że okazuje się nieoptymalne dla dużych zbiorów danych. Poza tym nie daje nam szczegółowych informacji np. dotyczących rozkładów konkretnych cech.